2025 年之後,AI Coding 工具開始進入真正的分水嶺。
早期市場討論大多停留在:
哪個模型比較強?
哪個工具寫程式比較快?
哪個 Agent 比較會修 bug?
Claude 比 GPT 更懂程式嗎?
但這些問題,其實越來越不重要。
真正開始拉開差距的,是這些公司對「未來軟體開發應該長什麼樣子」的理解。
這也是為什麼,同樣是 AI Coding 工具:
最後卻發展成完全不同的產品形態。
還沒仔細研究前,容易誤解它們是同一條路上的競爭者。筆者透過 AIMochi 筆記工具,整理多方公開資訊和最新報導內容,來探討它們更像是三種不同世界觀的投射。
2023 年以前,多數 AI Coding 工具本質上都只是:「會補全程式碼的聊天機器人」
Copilot 時代的核心邏輯,是:
你負責思考
AI 幫你補全
人類仍是主控者
但 Agent 時代完全不同。
現在的 Claude Code、Codex、Cursor,真正競爭的是:
誰能自主執行更多工作
誰能驗證自己的結果
誰能管理更長工作流
誰能降低人類介入次數
誰能更有效使用 Token
問題開始從:「AI 能不能寫程式?」
轉變成:「AI 能不能像工程師一樣完成任務?」
這也是為什麼 Terminal、Cloud Runner、Computer Use、MCP、Sub-Agent 開始變得重要。
因為這些東西,本質上都在解決同一件事:如何讓 AI 從「生成器」變成「執行者」。
Claude Code 的成功,很容易被誤解。
許多人認為:「Claude Code 成功,是因為 Claude 模型比較強。」
但這只說對了一半。
真正讓 Claude Code 爆發的,是它創造出一種前所未有的「代理沉浸感」。
這種感覺就像,我們除了在使用工具,更是在指揮一整個數位工程團隊
它大量使用:
子代理(Sub-agents)
即時動畫
Token 動態更新
並行任務
終端輸出流
多步驟操作感
這種設計有個重要效果:使用者會「感覺」系統非常強大。
即使有些任務本身並沒有真的更有效率。
這也是為什麼許多開發者開始形容 Claude Code 像「老虎機」。
因為它的互動模式,本身就在刺激使用者的多巴胺迴路。
從產品心理學角度來看,這其實非常合理。
根據多篇 Human-Computer Interaction 與 AI 協作研究,人類對「可視化進度」與「高頻回饋」會產生更強的信任感與控制感。
也就是說,即使兩個 Agent 完成相同任務。
一個安靜執行
一個持續顯示動畫、子代理、Token 增長、進度條
後者會被感知為「更強」。
而 Anthropic 顯然非常理解這件事。
真正值得注意的,是兩家公司對 Token 的態度。
這是整篇文章最重要的核心。
1. Anthropic 的邏輯:更多 Token 可以解決更多問題
Claude Code 的哲學,本質上是:如果模型夠聰明,那就給它更多上下文、更多工具、更多代理。
因此你會看到:
大量 Sub-agent
長上下文
高 Token 消耗
更長推理鏈
更重的代理工作流
在這種世界觀裡:
Token 不是成本,Token 是能力。
這也是為什麼 Claude Code 常常:
同時啟動多代理
進行反覆檢查
不斷重新推理
長時間運行任務
因為他們相信:更多 Token,最終能換來更高成功率。
這其實很接近大型顧問公司的運作模式。
如果一個人解決不了問題?
那就再派更多人。
OpenAI 則幾乎完全相反。
Codex 的核心哲學更接近:與其用更多 Token 猜答案,不如驗證答案。
這也是為什麼 OpenAI 開始大力發展:
Computer Use
Remote Execution
自動驗證
UI 操作
真實環境測試
本地機器控制
因為在 OpenAI 看來:最昂貴的,不是生成。
而是錯誤。
因此 Codex 的真正核心,不是「寫程式」。
而是:「確認程式真的能運作。」
這是一個極其重要的差異。
Anthropic 偏向:
推理密度
Agent 密度
Token 密度
OpenAI 偏向:
驗證能力
執行能力
環境互動能力
這兩者背後代表完全不同的 AI 未來。
很多人第一次看到 Computer Use 時,都覺得像噱頭。
但這可能是未來 Agent 最關鍵的能力之一。
因為真正困難的問題,除了:「AI 能不能產生正確的答案?」
更是:「AI 能不能確認答案有效?」
這也是為什麼 OpenAI 近年開始越來越重視:
電腦控制
GUI 操作
Browser interaction
自動測試
Remote environment
因為只要模型能:
修改程式
執行程式
打開瀏覽器
驗證結果
自我修正
那麼 Token 消耗就能大幅下降。
這與 Anthropic 的「更多推理」路線,形成鮮明對比。
Cursor 的定位又完全不同。
如果說:
Claude Code 是高沉浸代理
Codex 是驗證型代理
那 Cursor 更像:「可協作的雲端代理基礎設施」
Cursor 最大的優勢,不是 IDE。
而是它的 Cloud Agent。
因為它已經不只是:「幫我寫程式」。
更是:「幫整個團隊處理工作」。
例如:
Slack 問題回覆
雲端代理執行
多人協作
非工程師操作
遠端工作流
這件事非常重要。
因為它意味著:AI Coding 工具開始脫離「開發者工具」範疇。
逐漸變成:「企業工作系統」。
近期另一個快速崛起的概念,是 MCP(Model Context Protocol)。
MCP 的重要性,很可能被嚴重低估。
它真正具有意義的是:AI 如何接入外部世界。
在傳統軟體世界:API 是應用程式之間的橋梁。
但在 Agent 世界,MCP 更像是:
AI 與工具、資料、服務、環境的統一接口。
這也是為什麼越來越多 AI Agent 開始支援:
GitHub
Slack
Notion
Terminal
Browser
Local filesystem
未來 MCP 很可能會變成:AI 時代的 USB-C。
任何不能接入 MCP 的工具,都可能逐漸被邊緣化。
很多人以為 AI Coding 工具在競爭模型。
其實不是。
真正的競爭是:
誰能定義開發者未來的工作方式。
這也是為什麼:
Claude Code 強調終端體驗
Codex 強調驗證與可靠性
Cursor 強調雲端協作
因為一旦使用者形成習慣。
工作流就很難改變。
而工作流一旦被綁定:
Token 消耗
平台使用
生態系
MCP
插件
雲端代理
全部都會被鎖進去。
這與過去:
Windows vs Mac
iOS vs Android
AWS vs Azure
本質上是同一場戰爭。
| 面向 | Claude Code | Codex | Cursor |
|---|---|---|---|
| 核心哲學 | 高沉浸代理體驗 | 驗證與可靠性 | 雲端協作代理 |
| Token 策略 | 高 Token 消耗 | Token 效率優先 | 中間路線 |
| 主要場景 | 個人高強度開發 | 工程師工作流 | 團隊協作 |
| 核心優勢 | 代理感與推理 | Computer Use | Cloud Agent |
| 使用方式 | CLI 為核心 | App + Remote | IDE + Cloud |
| 產品風格 | 高互動感 | 工程效率導向 | 協作導向 |
| 商業方向 | 模型能力驅動 | Agent infrastructure | Enterprise workflow |
| 最大風險 | Token 成本失控 | 驗證環境複雜 | 雲端成本與維運 |
AI 產業目前有個很少被討論的現象:
很多產品正在優化「感覺」,並不一定是「結果」。
例如:
Token 動畫
即時輸出
子代理切換
高頻狀態更新
Loading 效果
Agent 思考流
這些設計不一定錯。
但它們開始接近:「用體驗掩蓋成本」。
因為對模型公司來說:
更多使用時間 = 更多 Token 消耗。
而 Token,本身就是營收來源。
因此未來 AI 工具市場,很可能出現兩條路線:
高沉浸、高 Token 消耗
高驗證、高效率
而這兩種商業模式,很可能都會成功。
接下來真正值得關注的,不是模型分數。
而是以下幾件事:
1. IDE 將逐漸退居背景
未來開發者可能不再:
長時間停留在 IDE
手動逐行修改程式
會逐漸轉變成:
指派任務
驗證結果
管理 Agent
工程師角色會逐漸變成:「Agent Manager」。
2. Terminal 可能重新崛起
Claude Code 的成功已經證明:Terminal 仍然是高效率工作流的核心。
因為終端:
可組合
可腳本化
可遠端
可整合
可代理化
這讓它非常適合 Agent 時代。
3. MCP 可能成為 AI 世界的基礎標準
未來 Agent 最大問題不是模型。
而是:「如何接入世界」。
因此 MCP 類協議的重要性,只會持續上升。
4. SaaS 將逐漸 Agent 化
未來很多 SaaS 不再需要完整 UI。
因為使用者可能只會說:「幫我完成這件事。」
Agent 會自己:
呼叫工具
操作系統
驗證結果
回傳成果
這可能重新定義整個 SaaS 產業。
以上僅供參考與資訊分享之用!若想快速了解更多資訊,透過 AIMochi 筆記工具,幫我們從海量資料中,梳理出關鍵資訊,讓我們精準掌握重要訊息!